【项目实战】Python基于卷积神经网络CNN模型和VGG16模型进行图片识别项目实战

372 篇文章 271 订阅

说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取。

1.项目背景

       深度学习(Deep Learning,DL)是机器学习研究中的一个新的领域,源自人工神经网络, 其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释图像、声音、文本等数据。深度学习属于无监督学习,通过组合低层特征形成更加抽象的高层特征或属性特征,以发现数据的分布式特征表示,学习更有用的特征,从而最终提高分类或预测的准确性。卷积神经网络(CNN)是深度学习框架的一种。CNN 的特征检测层通过训练数据进行学习,所以在使用时,避免了显式的特征抽取,而隐式地从训练数据中进行学习;再者由于同一特征映射面上的神经元权值相同,所以网络可以并行学习。CNN 以其局部权值共享的特殊结构在语音识别和图像处理方面有着独特的优越性,其布局更接近于实际的生物神经网络,权值共享降低了网络的复杂性, 特别是多维输入向量的图像可以直接输入网络这一特点避免了特征提取和分类过程中数据重建的复杂度。

       卷积神经网络(CNN)是一个多层的神经网络,它的基本结构就是输入层、卷积层(conv)、子采样层(pool-ing)、全连接层、输出层(分类器)。

2.数据获取

本次建模数据来源于网络(本项目撰写人整理而成),数据项统计如下:

数据详情如下(部分展示):

 上图为六种类型的图片。

上图为建筑类的图片,部分作为展示。

3.数据预处理

3.1 加载和读取数据

关键代码:

4.探索性数据分析

4.1.检查目标变量的分布

用Pandas工具进行统计,输出结果如下:

图形化展示如下:

 从上图可以清晰地看到每种类型图片的数量分布。

4.2.训练集图片类别饼图

通过上图可以看到六种类型的图片占比基本一致。

4.3.随机展示图片

 上图为随机展示的一张图片。

上图为随机展示的25张图片。

5.特征工程

5.1.数据标准化

关键代码如下:

 

把训练集和测试集图片数据进行标准化。

6.构建模型

主要使用使用CNN算法和VGG16网络,用于目标分类。

6.1建立简单的CNN模型

 

关键代码如下:

 6.1.1.绘制准确率和损失曲线图

 关键代码如下:

6.1.2.模型评估

模型损失:

随机绘图:针对预测的结果进行随机绘图。

针对分错类的图片进行绘图:随机绘制25张图片。

 混淆矩阵:

关键代码:

6.2.应用VGG16模型

关键代码:

 6.2.1.PCA降维

 关键代码:

6.2.2.绘制准确率和损失曲线图

6.2.3.最终模型准确率 

 

关键代码如下:

7.结论与展望

       基于深度学习的研究已经成为当今机器智能领域的热门方向,越来越多的科研人员将目光锁定在深度学习的研究和应用上。而卷积神经网络(CNN)作为一种受欢迎的深度学习框架,在图像识别和图像分类方面的优势也越来越明显。

       综上所述,本文采用了CNN和VGG模型,最终证明了我们提出的模型效果良好。准确率达到了89%,可用于日常生活中进行建模预测,以提高价值。

images = []
labels = []

print("Loading {}".format(dataset))


# 本次机器学习项目实战所需的资料,项目资源如下:

链接:https://pan.baidu.com/s/1IVvenC0-rAbCD8qcvqaBzw 
提取码:weha






# 循环访问与类别对应的每个文件夹
for folder in os.listdir(dataset):
    label = class_names_label[folder]

    # 循环访问我们文件夹中的每个图像
    for file in tqdm(os.listdir(os.path.join(dataset, folder))):
        # 获取图片的路径名字
        img_path = os.path.join(os.path.join(dataset, folder), file)

        # 读取图片并调整大小
        image = cv2.imread(img_path)
        image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
        image = cv2.resize(image, IMAGE_SIZE)

        # 图片和标签输出到列表
        images.append(image)
        labels.append(label)

images = np.array(images, dtype='float32')
labels = np.array(labels, dtype='int32')

output.append((images, labels))
  • 7
    点赞
  • 168
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
基于CNN的人脸识别是指使用卷积神经网络CNN模型来实现人脸识别的功能。在这个过程中,程序使用了Python的numpy、theano和PIL等库,并采用了类似LeNet5的CNN模型。 要进行基于CNN的人脸识别,首先需要将人脸图像转化为数组或矩阵的形式。这可以通过使用Python的图像库PIL来实现,只需几行代码就可以完成。具体的方法可以参考之前一篇文章中的说明,该文章提供了读取和保存图像数据库的示例。 通过使用CNN模型进行训练和测试,可以将人脸图像与已知的人脸数据库进行比对,并识别出输入图像中的人脸属于哪个人。基于CNN的人脸识别模型在olivettifaces人脸数据库上进行了实验,将模型的误差降到了5%以下。 需要注意的是,这个程序只是作者个人学习过程中的一个玩具实现,样本规模较小,模型可能会过拟合。因此,在实际应用中,还需要根据具体情况对模型进行调整和优化。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [DeepLearning tutorial(5)CNN卷积神经网络应用于人脸识别(详细流程+代码实现)](https://blog.csdn.net/u012162613/article/details/43277187)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

胖哥真不错

您的鼓励,将是我最大的坚持!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值